查看原文
其他

你的隐私正在被 AI “窥探”,马赛克也不管用了

王晓曼 程序人生 2021-04-26
整理 | 王晓曼
出品 | 程序人生 (ID:coder _life)
你所知道的 AI 技术能有多厉害?前不久炒得火热的 AI 换脸技术,可以把人物的脸替换成别人的,京剧里的“变脸”在现实中也能实现了,要有多神奇就有多神奇。

让人意想不到的是,AI 还原马赛克技术已经成熟到让你无法想象的地步了。

近日,一个名为 Depix 的项目火爆 GitHub,上线没几天,在 GitHub 上标星已超过11.3k,累计分支超过1.1k个。

(GitHub地址:https://github.com/beurtschipper/Depix)

据悉,Depix 能够将打上马赛克的文字解码,恢复成原图中的文字,但目前只适用于使用线性方框滤波器创建的像素化图像。
从视频《马赛克在AI面前可能不安全了》中可以看到,被打码的文字已经用马赛克覆盖的面目全非,完全看不出一点原始的痕迹,而用 AI 技术还原后的该文字,文字的排列基本可以看清楚,准确度也很高,稍加推理即可得到原始文字。

截图来自:视频《马赛克在AI面前可能不安全了》
据项目作者介绍,使用 Depix 将打上马赛克的文字恢复成原图,只需要简单的四步就可以实现:
  • 从屏幕截图中截取像素块作为一个选区。

  • 在具有相同字体设置(包括文本大小、字体、颜色、hsl)的编辑器中,粘贴具有预期字符的 De Bruijn 序列。

  • 制作一个序列的屏幕截图,尽可能使用与创建像素化图像相同的屏幕截图工具。

  • 执行如下命令:

python depix.py -p[pixelated rectangle image] -s [search sequence image] -o output.png
同时,作者也分享了实现这一技术背后所用到的算法:
Depix 算法利用了线性盒滤波器分别处理每个色块的特点,它对搜索图像中的每一个块进行像素化来寻找直接匹配。
对于大部分像素化的图像,Depix 能够找到单个匹配结果,它假设这些结果是正确的,然后将周围多个匹配块的匹配在几何上与像素化图像中相同的距离进行比较,并假设这些匹配也是正确的。这个过程重复几次。
当正确的块不再有几何匹配后,Depix 将直接输出所有正确的块,而对于多匹配块,它将输出所有匹配的平均值。
虽然 Depix 算法输出的结果并不太完美,但相比之前的其它技术而言,已经算不错的了。
除了字符“密码”,清除图像马赛克也一直备受关注,一些技术能将面目模糊的人像变得清晰可辨,例如谷歌的超强像素递归方案、杜克大学的 AI 算法 PULSE等。


(谷歌的超强像素递归方案)


(杜克大学的 AI 算法 PULSE)

对于这个项目的火爆,网上的质疑声一片,不少网友担心会不会方便坏人窥探人们的隐私,也有人为那些草草打码就以为能隐藏机密信息的人“捏把汗”。
网友@山鬼花兮:研究的初衷是为了提醒人们保护隐私???确定不是方便坏人窥探人们的隐私吗?
网友@正则邱:这是基于大量人脸数据算出来的吧?反正我是不相信已丢失的细节能被还原
网友@Kang紫琪同学:所以一般马赛克我都马两次以上……以前总觉得有软件可以还原,居然现在才问世?
作者在文中写到:该项目开发的初衷并不是窃取信息,而是为了提醒人们注意信息安全。
无论是 AI 还原马赛克文字还是还原人脸图像,其初心都是科技向善。技术是一把双刃剑,有利也有弊,我们在享受技术进步带来的便捷时,也应该时刻警醒,不要将这些技术用于不良或非法用途。
对于这件事,你怎么看?欢迎在留言区评论交流!
参考链接:
https://github.com/beurtschipper/Depix

https://mp.weixin.qq.com/s/K-t2OXo2fWtR7vIz1tpHqg

https://search.weixin.qq.com/k/RVBWUVBHaFhbRVZUQVFebkdfSk5eakdWVF5tR1dSblRYWiRHVFokJERv?scene=3

#欢迎来留言#
留言点赞数量最多的前三名
程序人生携手【北京大学出版社】送出
《深度学习笔记》一本
截至12月18日14:00点
更多精彩推荐
程序员有钱了都干什么?买豪宅,玩跑车,上太空!| 涛滔不绝
被微软称为 “世界的电脑” ,Azure 到底有多牛?
编写贩卖《和平精英》游戏外挂,5人被判刑;苹果推出轻App码;Firefox 84.0发布|极客头条
赠书 | 实现病人数据自动分析建模,Python能做的比你想象得更
我是Redis,MySQL大哥被我害惨了!
“刚毕业1年,做数据分析凭什么涨薪三连跳!”网友:吹的不多..
点分享点点赞点在看

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存